ЗАПАСНЫХ ЭЛЕМЕНТОВ

ПРИ РАНДОМИЗИРОВАННЫХ РЕШЕНИЯХ

Оптимальные решения, полученные с учетом дополнительных ограничений, например, на вероятность отказа вида (3.29), имеют важную особенность — элементы рандомизации, которая требует модификации методики определения количества ЗЭ. Это обуслов­лено тем фактом, что при построении фундаментальной матрицы

(5.9) не ясно, относить или не относить состояние с элементами рандомизации к области оптимальной остановки.

Рассмотрим приближенные способы оценки количества ЗЭ при рандомизации. Пусть матрица решений D имеет рандомизирован­ные элементы Dn и Du= 1 — Dix в состоянии і. Остальные элемен­ты являются нерандомизированными; в область оптимальной оста­новки строго входят те элементы, для которых k>i.

I. Опишем процесс восстановления при появлении рандомиза­ции решений. Пусть в состоянии / с вероятностью Dn осуществля­ется восстановление, причем после его проведения состояние име­ет номер 1. Это означает, что среднее время работы функциональ­ного элемента соответствует случаю, когда область оптимальной остановки включает состояние і. Обозначим такое среднее время через Ті, а дисперсию этого времени через оД

При принятии решения типа Dn среднее время работы необхо­димо определять для случая, когда область оптимальной остановки уменьшается и содержит состояния i+1,…, F. Обозначим для это­го случая среднее время как 7Vh, а дисперсию как а2+1. Таким об­разом, с вероятностью Dn среднее время до поглощения (т. е. до попадания в зону оптимальной остановки) равно Ті и с вероятно­стью Dn — Ti+. Тогда на основании теоремы о полном математи­ческом ожидании среднее время до поглощения для управляемого процесса с рандомизированной матрицей решений.

г,=ад+(1-А,)г<+1. (5.11)

Очевидно, что в каждом из этих случаев существует своя функ­ция распределения времени до поглощения. Обозначим соответст­вующие плотности вероятностей через fi(t) и fi+x(t). На основании теоремы о полной вероятности

/а{t)—Dnf і (^)-J-(l — On) f i+1 (^).

Дисперсия времени до поглощения при рандомизации

°!= ] (t — Тя)2 /а (/) dt—Dn j +

—оо —ОО

+(1-£>п) ] (t-TsYfi+x(t)dt.

— оо

Опуская промежуточные выкладки, получим

°!=°?Аі+°?+і(1-А1ЖІ-А-1) Da(Ti+l—Ti)2. (5.12)

Из выражения (5.12) следует, что дисперсия времени до погло­щения с учетом рандомизации складывается из взвешенных диспер­сий ‘времени до попадания в зоны оптимальной остановки, когда эти зоны соответственно включают и не включают состояние с ран — чомизацией, и слагаемого, зависящего от разности средних времен для этих же зон.

Выражения (5.11) и (5.12) позволяют, используя (5.8), прибли­женно вычислять необходимое количество запасных элементов:

«I (*)=— + «„ у. з/2 • (5- 13)

II. Другой способ решения задачи связан с получением оценок верхней и нижней границ числа ЗЭ. Заменим матрицу D двумя матрицами D++ и D+. Матрица D++ получается из D путем выбора элемента Du— 1. Это означает, что состояние і с вероятностью еди­ница включается в область оптимальной остановки. Введем неран- чомизированную матрицу D+, у которой Dn = 0. После замены мат­рицы D на D+ и D++ (см. § 5.2) можно получить значения п++ и //’, соответствующие матрицам D++ и D+. Очевидно, что п++ будет верхней, а п+ — нижней границей для истинного количества ЗЭ, еоответствующего Дп>0, т. е. п++>я>я+, причем границы опреде­ляются с заданной гарантийной вероятностью. Однако эти границы являются достаточно широкими, и было бы желательно иметь бо — Iее точные оценки. Такие оценки можно построить на основе ин­терполяции, исходными данными для которой являются значения //|+, п+ и Du. Допустимость такой интерполяции обусловлена мо­нотонным изменением числа ЗЭ в пределах [п+, и++] при 0<Dfld. Вследствие того, что кроме граничных значений п и вероятности /і, і никакой информации больше нет, наиболее целесообразно при­менить линейную интерполяцию. В этом случае оценка истинного числа ЗЭ

«П = я++(«++ — п+) Dn — п++— (л+* — я+)(1— Dn). (5.14)

Описанный способ получения оценок количества ЗЭ может быть использован при введении ограничения, учитывающего неполное восстановление (3.37). В этом случае типовая матрица решения имеет вид

/1……………… ‘

.1…………………….

Подпись:. . 1 . . . .

. . . 1 . .

DFlDf2 ■ ■ ■)

Элементы матрицы DF-tDf2=. Сделаем состояние F логлощаю — щнм и, используя методику § 5.2, вычислим фундаментальную мат­рицу, векторы и т2, а затем рассчитаем на основе (5.8) число
запасных элементов. Особенность этого расчета будет состоять в том, что величина n(1) будет определяться при 7"=т<Н и о2=т^1)5 а для оценки будут использоваться Т=т*2) и о2=т<2), т. е. значение среднего числа шагов до попадания в поглощающее со­стояние и его дисперсия при условии, что начальное состояние/= —Q. При таком выборе исходных данных и(1> будет нижней оцен­кой, а «(2>—верхней оценкой числа запасных элементов. Далее, ис­пользуя линейную интерполяцию по типу (5.14), оценим число за­пасных элементов с учетом рандомизации решений:

п = n!»Dn _|_ «(2) [ 1 — — Dfl] == я<2> — (я<2> — я<4) Df

В случае если область оптимальной остановки содержит более одного элемента, необходимо использовать алгоритм построения матрицы с поглощением и расчета ее параметров (см. § 5.2). Если матрица решений имеет не два, а больше элементов рандомизации

в строке (например DFi, і— 1, 2,…, F — то, рассуж-

дая по аналогии, можно показать, что оценкой числа запасных эле-

F-Г

ментов является величина п= ^ n<-‘WFi. где n(i)—число запас­ів і

ных элементов, полученное при использовании в качестве исходных данных для (5.8) значений Г,- и о,-2, соответствующих г’-му началь — ному состоянию.

Очевидна возможность обобщения описанного подхода при сов­местном использовании ограничений (3.29) и (3.37), когда необхо­димо вычислять значения Г и о2 с одновременным учетом началь­ного состояния и области оптимальной остановки.

III. Еще один способ решения задачи основан на применении метода Монте-Карло. При этом способе моделируется управляе­мый процесс, описываемый матрицами вероятностей переходов Q и решений D (имеющей элементы рандомизации). На заданном интервале [О, /] (достаточно большом по сравнению со средним временем попадания из начального состояния в область оптималь­ной остановки) подсчитывается количество восстановлений (замен) п. Моделирование повторяется многократно (fc>l), что позволяет получить набор случайных величин (nh, k = l, К). Проводя стати­стическую обработку полученного массива {nh}, можно найти закон распределения, оценки среднего значения п и дисперсии аэт2 коли­чества замен на интервале [о, а соответствующие фиксированной матрице решений D, а следовательно, и необходимое количество запасных элементов.